Geotribu1
2023-11-10
En juin dernier, Avignon a accueilli les Rencontres R, le plus grand événement français dédié au célèbre logiciel libre de statistiques. Il y avait un invité spécial : le spatial. Ce qui tombe bien, car si je ne suis plus débutante sur ce logiciel, j’ai encore des marches de progression à passer.
C’est de ce point de vue que je propose ce retour sur trois jours de présentations et de discussions.
Le premier jour des rencontres commence officiellement l’après-midi, le temps que tout le monde arrive sur le site. L’organisation (je reviendrai sur son magnifique travail plus bas) a donc banalisé la matinée avec des tutoriels. Si le machine learning était proposé, si Quarto était également au menu…
La session Quarto avait l’air très chouette.
… j’étais bien évidemment inscrite à l’atelier d’analyse
spatiale avec R proposé par Kim Antunez (INSEE) et Etienne Côme
(Université Gustave Eiffel). Au programme, carte statistiques, cartes
interactives et analyse spatiale avec les deux. D’abord on parle des
cartes statiques, avec la révolution de “sf” et sa déclinaison spatiale
“sfg”, soit simple
feature geometry, qui a l’avantage d’être composé d’autre chose
que de 0 et 1, ce qui le rend compréhensible
par un être humain.
Le package mapsf a pris le pas sur d’autres, comme cartography. J’y ai notamment appris l’existence du geoparquet pour traiter les gros volumes de données spatiales… Et que différentes versions de R peuvent bloquer dans des exercices sans que l’on n’est aucun message d’erreur (sinon ce n’est pas drôle). Je n’ai pas eu le temps de tout explorer pour la partie carte interactive, les deux heures étant très denses pour tout le programme prévu. C’est un atelier parfait pour les géographes, mais les personnes extérieures à cette thématique sont restées bloquées sur les tenants et aboutissants de termes comme les zones tampons ou polygones de Voronoï.
Le choix d’une conférence d’ouverture est un exercice d’équilibriste. Il faut offrir un contenu riche, tout en étant accessible et percutant. Avec ce cahier des charges en tête, le choix d’Aurélie Vache (OVHcloud) était plus que brillant.
Après avoir rappelé que c’est un problème de comparaison, que l’on trouve donc beaucoup dans le milieu de la tech’ et particulièrement dans l’informatique, que les femmes sont assez touchées (mais pas uniquement), elle a donné de bonnes astuces :
Au passage, elle a égratigné avec un mordant libérateur l’obligation d’avoir le bon cursus, voire la passion des recrutements avec obligatoirement LE diplôme de LA bonne école.
Elle a rappelé le validisme ambiant, dont nos milieux ne sont pas épargnés, avec le talent de quelqu’un capable de présenter avec humour des horreurs. Bonne nouvelle, pour la voir changer de la boue en or, sa présentation a été filmée et je ne peux que vous la conseiller.
Le package GlitteR
explore le web sémantique, comprenez des données qui sont elles-mêmes
reliées à d’autres données, ce qui donne par exemple Wikidata. J’ai
appris que l’on y accède grâce à des points d’accès, les
endpoint. Lise Vaudor (CNRS) rappelle fort justement que
l’inconvénient des graphes de connaissance, c’est que l’on ne peut pas
avoir une vision d’ensemble comme avec un tableau… D’où l’importance de
connaître son terrain ou de partir d’un terrain connu afin de pouvoir
couper les branches inutiles du graphe. Et GLitteR dans tout cela ? Il
permet d’accéder aux données de Wikidata avec R, sans avoir à passer par
le SPARQL. Une grosse avancée pour les personnes pas du tout à l’aise
avec ce langage. Il est vrai que tout le monde n’a pas encore eu de wikimédien
ou wikimédienne en résidence (patience).
Chez Enedis, l’application Shiny est traitée de manière très originale : comme un prototype de futures potentielles applications. Par exemple, peut-on ajouter une borne de recharge électrique sans faire de surcharge sur le réseau ? Avec Shiny, on peut modéliser l’ajout d’une borne et voir ce qui se passe.
Ce qui m’a intéressée, c’est leur méthode : Shiny est pensé pour avoir des retours et des améliorations continues durant 3 ans.
Ça marche ? Enedis développe une application dédiée hors Shiny.
Ça ne marche pas ? Abandon de ce test, sans avoir eu à avancer trop de moyens coûteux.
C’est LA grande annonce du colloque.
L’institution publique de la statistique française passe sur LE
logiciel libre des statistiques. Un changement pareil ne se fait pas
naturellement dans une institution aussi ancienne. Alors comment
a-t-elle procédé ?
Comment impulser de bonnes pratiques de codage, comme la documentation ? L’INSEE en a listé plusieurs ici, dont :
Depuis 2016, il existe un groupe des Rladies en
France qui regroupe plus de 500 personnes. Beaucoup de leurs
événements parisiens sont aussi disponibles en ligne, comme les rediffusions
de leurs réunions.
![]()
Faire du code R, ui. Faire de magnifique réalisations, ui à nouveau. Les documenter (un motif récurrent de ces conférences, vous l’aurez noté), c’est encore mieux.
Face à la dispersion des ressources sur R en sciences humaines et sociales, Hugues Pecout (Géographie-cités) nous a fait la présentation de Rzine. Ce site internet centralise la documentation existante, mais aussi et surtout, il permet de publier des fiches techniques inédites. Avec un DOI bien sûr ! Idéal pour valoriser son travail, notamment dans les environnements de recherche.
C’est une présentation si dense et riche qu’il vaut mieux renvoyer à
la vidéo pour
en picorer tous les (nombreux) éléments intéressants relatifs à son
niveau.
Mais pour une non-informaticienne comme moi, en voici quelques uns :
Yan Holtz (Datadog) est revenu durant cette plénière sur la présentation des données avec R et sur les outils utilisés en fonction du public. Par exemple, si des collègues ont du mal sur R, leur proposer datawrapper.
Il a rappelé que ggplot2 a été en 2007 une révolution en faisant passer R d’un outil exploratoire à un outil explicatif qui permet de faire de la dataviz avec R. Une révolution qui a infusé jusqu’à Python et JavaScript. Il a également mentionné Rtutor pour faire du Shiny aidé par chatGPT.
![]()
Paul CARTERON a présenté LE package qui permet d’accéder à toutes ses données, Lidar compris : :star: happign :star:. C’est un des éléments qui me fait aimer R et me pousse à m’y former : la facilité d’accès aux données avec le logiciel.
On l’a indiqué, ces journées R portaient
spécialement sur le spatial. Timothée Giraud (UAR RIATE) est donc venu
présenter le
travail autour de ce package phare.
Il a commencé par un historique rappelant la généalogie des différents packages qui intègrent la géographie et qui petit à petit a permis l’émergence de :star: mapsf :star:.
On l’a dit plus haut, mapsf s’appuie sur le standard simple feature (aussi mobilisé par PostGIS) pour importer, exporter et faire les géotraitements de données géographiques. Il est également revenu sur la mise à la retraite d’un package, exemplaire selon lui de ce qu’il faut bien faire dans la communauté.
Il est revenu sur les possibilités de package, avec des exemples avignonnais évidemment.
J’ai appris que la communauté R avait une passion pour les palettes de couleur. Avec par exemple paletteer et l’appli shiny cols4all qui permet de tester le rendu pour les personnes daltoniennes… Du moins si les fantastiques palettes ColorBrewer, déjà incluses dans mapsf, ne suffisent pas.
C’est au tour de la présentation de Lise Vaudor qui nous propose un retour sur son parcours et ses réalisations.
Ingénieure agronome, elle a été recrutée au CNRS après sa thèse en écologie/statistiques, notamment grâce à ses compétences en R. Son travail au quotidien s’articule autour du soutien à la recherche et elle propose beaucoup de formation continue… Notamment auprès d’un public doctorant tRaumatisé.
C’est de cette expérience de terrain qu’est né son blog Ratique et la
création de contenus visant à démocratiser R. Un contenu qu’elle a voulu
illustré, avec ses propres dessins (tant qu’à faire), avec des couleurs
pastels, des GlitteR paillettes et des blagues. Elle propose
des antisèche
illustrées et soignées (devinez les couleurs ? pastels, bravo) et
des métaphores visuelles accessibles qui piochent dans la dataviz. Du
contenu créé sur son temps de travail (et valorisé comme tel
par le CNRS).
Comment parler à tout le monde quelle que soit la discipline ? Lise Vaudor transporte son public dans le monde de la magie grâce à ses “grimoires”. Mais elle travaille moins sur ce contenu ces temps-ci.
Car elle est revenue sur son parcours personnel, notamment sa double maternité qui a quelque peu chamboulé sa vie. Elle a donc rejoint les RLadies, “seulement maintenant” car elle n’en ressentait pas le besoin. Elle indique ne pas avoir eu à souffrir de sexisme dans la communauté R.
Les raisons ?
Pour elle, c’est l’ouverture de la communauté. Une ouverture qui se retrouve aussi dans l’équipe du programme de ces journées, qui a voulu mettre à égalité les différents genres, mélanger secteur privé/public, universitaire et non-universitaire etc.
C’est une communauté capable de valoriser ses paillettes, ses dessins, ses couleurs pastels et tout le contenu de ses formations, par exemple par cette invitation à une intervention dans une plénière. Une intervention au même niveau que celle présentant un gros package, comme celui de Timothée Giraud.
Ce n’est bien entendu pas visible dans ce compte-rendu : les Rencontres
R étaient mûrement réfléchies en termes d’inclusion et d’environnement.
C’est la première fois que je viens à un événement professionnel avec un
code de
conduite. Cette charte est à signer lors de l’inscription, rappelée
en plénière, à chaque moment collectif et nous avons eu une présentation
des personnes à qui s’adresser en cas de problème. C’était bienvenu.
L’engagement était aussi écologique : les goodies venaient des environs. La bière, brassée spécialement pour l’occasion, était locale, tout comme le jus de fruit. Nous avions de la verrerie aux couleurs des rencontres, produite elle aussi tout proche, et que l’on utilisait donc pour les pauses cafés. Le tour de cou, avec un clin d’oeil malin à R, rappelait toutes les informatiques pratiques, dont le programme numérique, le programme papier étant limité aux rares personnes sans téléphone. Enfin, pour garder un ultime souvenir de ces journées, le tour de cou ensemencé peut se planter afin d’obtenir de délicieuses plantes aromatiques.
Plusieurs sessions étaient en parallèle : ce billet présente à peine la moitié des interventions. Il y en a bien d’autres, que vous pouvez aller découvrir ici :
Merci à l’organisation pour ces journées !
Delphine Montagne
Cartographe et géomaticienne, je participe à plusieurs projets libres, comme OpenStreetMap et Wikipédia. J’aime autant les cartes que la biodiversité, passions que je partage toujours avec enthousiasme.
Vous êtes autorisé(e) à :
“Retour sur les Rencontres R d’Avignon” publié par Delphine Montagne sur Geotribu sous CC BY-NC-SA - Source : https://geotribu.fr/articles/2023/2023-11-10_retour-conference-journees-R-2023/